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jj 要 : 六 痛 脑 电 的 自动 检测 是 一 个 不 平衡 分 类 问题 。 提 出 一 种 新 的 不 平衡 分 类 算法 ， 基 于 增 减 序列 合并 周期 分 割 算 
法 提取 时 域 特征 ， 引 入 随机 映射 优化 了 旋转 森林 的 计算 效率 ， 进 而 计算 基于 海 林 格 距 离 的 贝 叶 斯 最 小 风险 来 给 出 测试 
样本 标签 。 该 算法 在 1 s 片段 上 得 到 了 90.66% 灵 敏 性 ，92.52% 特 异性 ，F2 分 数 为 0.9055， 并 且 检 出 了 98.569009 27A 
发 作 ， 检 测 延迟 为 1.32 s， 在 不 平衡 的 闯 痛 脑 电 数据 集 上 表现 出 了 良好 的 性 能 ， 对 于 着 痛 辅助 诊断 有 着 极 大 的 临床 意 
义 。 

关键 词 : A; 时 域 特征 ; 随机 映射 ; 旋转 森林 ; 代价 敏感 ; 贝 叶 斯 最 小 风险 
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Automatic detection of epileptic EEG based on minimum Bayesian risk and rotation forest 
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(Dept. of Automation, School of Information Science & Engineering, East China University of Science & Technology, 
Shanghai 200237, China) 


Abstract: Automatic detection of epileptic discharges in electroencephalograph (EEG) is an imbalanced classification 


problem. This paper proposes a novel automatic epileptic EEG detection approach. This study calculates the time domain 


features based on the merger of increasing and decreasing sequence (MIDS) , and employs Random Projection to improve the 
complexity of Rotation Forest, as well as predicts the sample label using Minimum Bayesian Risk based on the Hellinger 
distance. This approach yielded 90.66% sensitivity, 92.5296 specificity and F2-score of 0.9055 in EEG segment classification 
task. Moreover, the proposed approach achieved 98.56% sensitivity of seizures with the average latency 1.32s. The proposed 
method shows good performance on the epileptic EEG imbalanced data, and has great clinical significance for the auxiliary 
diagnosis of epilepsy. 
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著 的 提升 。2010 4E, Shoeb 等 人 外 提取 了 脑 电 的 时 空域 与 功率 

谱 特 征 ， 讨 论 了 机 器 学 习 算 法 在 疗 病 发 作 自动 检测 中 的 应 用 效 

癫 病 是 一 种 由 脑 部 神经 元 异常 放电 引起 的 慢性 疾病 ， 癖 痫 果 ， 得 到 了 96% 的 检 出 率 以 及 4.6s 的 发 作 检测 延迟 。2012 年 ， 
的 发 作 往往 会 给 病人 带 来 极 大 的 痛苦 。 世 界 卫生 组 织 (WHO) —— Martis 等 人 9 提出 了 一 种 基于 经 验 模 态 分 解 (EMD ) 提取 脑 电 
在 其 2017 年 的 报告 中 指出 四， 全 世界 大 概 有 50 IRR Bn 特征 的 方法 ， 并 且 使 用 C4.5 bt 得 到 了 
其 中 的 25% 为 儿童 。 医 生 诊 断 疗 痫 最 直接 的 方式 为 人 工 判 读 脑 ”95.33% 的 准确 率 。2014 E, Chen 等 人 外 提出 了 基于 小 波 分 解 的 
有 图 ， 这 一 过 程 是 非常 耗 时 的 ， 并 且 给 医生 带 来 了 较 大 的 工作 ”极限 学 习 机 疗 病 发 作 检测 模型 ， 比 较 了 样本 粮 ， 近 似 灶 与 递归 
负担 。 因 此 ， 提 出 一 种 高 效 的 、 精 准 的 闻 病 脑 电 自动 检测 的 算 ”定量 分 析 RQA) 等 非 线 性 特征 的 分 类 效果 。2015 £, Donos 
去 对 于 瘦 病 的 辅助 诊断 有 着 极 大 的 临床 意义 。 等 人 铝 提 取 了 多 个 维度 的 信号 特征 ， 并 且 将 随机 森林 应 用 于 癖 
癫 病 患 者 的 脑 电 分 为 发 作 期 与 发 作 间 期 两 部 分 ， 其 特征 波 ”” 冯 分 类 中 ， 得 到 了 93.84% 的 灵敏 性 ，3.03s 的 检测 延迟 。 随 着 
包括 赤 波 、 尖 波 、 棘 慢 复合 波 与 尖 慢 复合 波 。 妆 病 脑 电 检 测 这 深度 学 习 的 兴起 ，2017 Æ, Acharya 等 人 中 将 脑 电信 和 号 分 为 发 
一 课题 已 经 引起 了 大 量 科研 工作 者 的 关注 ， 随 着 近 些 年 来 机 器 ， 作 期 ， 发 作 前 期 与 正常 脑 电信 号 三 部 分 ， 提 出 了 深度 卷 积 神经 
学 习 方 法 的 快速 发 展 ， 疗 病 脑 电 自动 检测 算法 的 效果 也 有 了 显 ”网 络 的 癫 病 发 作 的 多 分 类 算法 。 在 疗 病 预测 领域 ， Khan SEAN 
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基于 小 波 分 量 与 卷 积 神经 网 络 
以 及 0.142/ 小 时 的 误 判 率 。 
E MERKEA K 
域 、 时 频 域 以 及 非 线 性 特征 均 


得 到 了 87.8% 的 癫 闯 发 作 检 出 率 


电 自动 检测 的 研究 中 ， 时 域 、} 
有 所 涉及 。 其 中 时 域 特征 是 最 本 


质 的 特征 ， 医 生 在 临床 上 判 


pi E Ec] rp PADO REESE FIC E 


} 域 波形 。 时 域 特征 


往 是 时 


无 须 作 变 换 就 可 以 观测 到 的 信 


比 其 他 特征 


时 域 特征 有 着 明确 的 物理 意义 ; 


有 着 以 下 三 点 优势 : a) 
a 是 
号 平稳 的 假设 。 在 


组 织 原则 的 信号 波形 处 


Bi E 
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时 方法， 这 种 方法 通过 学 习 医 


生 判 读 脑 电 图 的 视觉 感知 与 完 形 


的 过 程 来 建立 模型 ， 有 效 而 灵 


活 地 分 割 了 信号 的 周期 ， 突 出 ] 


时 域 波形 状 特征 
Frau. EEUU 
好 的 性 能 。 
在 闻 病 脑 电 自 动 检测 这 一 
量 是 大 大 少 于 正常 脑 电 样本 的 ， 
分 类 的 问题 , 而 不 平 


的 噪声 


去 除了 元 余 信息 ， 
自动 分 离 以 及 睡眠 自动 分 


衡 数据 集 训练 出 的 模型 
此 时 的 模型 准确 率 无 法 很 好 地 评价 模型 怕 


方法 已 经 在 疗 病 放电 
期 中 体现 了 良 


问题 中 ， 可 采集 到 的 疗 病 波 的 数 
因此 实际 上 这 是 一 个 不 平衡 二 
般 会 偏向 多 数 类 ， 

能 6。 在 数据 层面 


LE 


上 ， 不 平衡 数据 集 可 以 使 用 欠 
衡 ， 但 这 两 种 方法 都 有 着 各 自 


欠 抽 样 或 过 抽样 方法 来 使 其 变 得 平 
的 缺陷 。 欠 抽样 方法 会 减少 模型 


学 习 到 的 多 数 类 样本 信息 ， 而 


过 采样 方法 通过 随机 复制 少数 类 


样本 来 实现 数据 集 的 平衡 ， 这 样 会 导致 模型 的 泛 化 性 能 变 差 ， 


容易 过 拟 合 .SMOTE02 算 法 通过 近邻 来 生成 不 重复 的 少数 类 样 


本 ,但 容易 造成 类 边界 模糊 。 
另 一 种 解决 不 平衡 数据 集 问题 


代价 敏感 Ccost-sensitive) 思想 是 


的 方法 ， 它 是 针对 不 同类 错 分 代 


价 不 同 所 提出 的 模型 学 习 思 想 
误 率 ， 而 是 通过 预测 的 最 


Domingos! 


即将 基 分 类 器 当 作 黑 箱子 ，i 
念 来 更 新 训练 集 标签 。 
假设 各 类 错 分 代价 相同 ， 而 对 


3 提出 了 基于 元 代价 


学 习 方 法 不 关注 模型 的 错 
价 来 训练 与 选择 模型 。 
i (Metacost) 的 代价 敏感 算法 ， 
通过 代价 敏感 矩阵 得 出 的 误 分 类 风 


, 这 
小 代 


在 分 类 问题 上 ， 大 多 数 机 器 学 习 方 法 都 


于 不 平衡 数据 集 则 不 是 这 样 ， 


少 


数 类 样本 比 多 数 类 样本 珍贵 ， 并 且 应 当 对 少数 类 的 错 分 施加 更 
大 的 惩罚 ， 因 此 代价 敏感 思想 是 一 种 在 算法 层面 上 处 理 不 平衡 
数据 集 的 方法 。 


本 文 的 提出 了 一 种 快速 、 
言 号 中 着 病 波 的 自动 检测 问题 
平衡 数据 集 ， 


以 此 来 研究 在 类 别 不 平衡 情况 下 所 提出 的 算法 自 


高 效 的 不 平衡 分 类 算法 ， 并 脑 电 
进行 分 析 ， 所 使 用 的 数据 集 为 


习 


的 性 能 。 
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言 号 特征 提取 方法 ， 算 法 
两 部 分 : 
a) 改 进 了 旋转 森林 算法 0， 


林 特 征 旋转 过 程 中 的 PCA Wk 
Johnson-Lindenstrauss Lemma 
度 。 
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海 林 格 距离 来 评估 样 


上 最 小 


本 文 提出 了 基于 视觉 组 织 原 则 的 时 域 
部 分 主要 的 贡献 与 创新 点 可 分 为 以 下 


IE OUAIS TERT E 
射 来 提高 运算 的 时 间 效 率 ， 
定理 保证 了 随机 降 维 方法 的 精 


风险 的 代价 敏感 分 类 方法 ， 根 据 


本 不 平衡 程度 ， 并 赋予 少数 类 和 多 数 类 不 


Ve | 
IHE, $: 基于 贝 叶 斯 最 Chinaxi MEE AM 

BERR. WIR EREE HUEECZIS TG XL ,— M ÉETÓR 
测 样本 分 为 误 分 类 风险 最 小 的 那 一 类 。 相 比 传统 方法 ， 这 一 基 
于 贝 叶 斯 最 小 风险 的 方法 有 效 地 提高 了 少数 类 即 瘦 病 波 的 检 出 
1 ”方法 与 模型 
1.1 ”时 域 特征 提取 
1.1.1 基于 视觉 组 织 原 则 的 周期 分 割 法 

这 一 简单 高 效 的 时 域 算 法 在 之 前 的 研究 中 四 已 被 详细 介 
绍 ， 在 这 一 小 节 简 单 陈述 算法 流程 与 相关 概念 。 


值 ， 则 认为 这 三 个 点 
i 到 i+m 为 下 降序 列 。 
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图 1 相 邻 波形 的 11 种 组 合 模式 , 空 


心 圆 表示 完整 的 波形 组 合 ,实心 圆 为 


不 完整 的 波 
增 减 序列 。 定 义 s(D 为 时 序列 骨 
Ws) sam) 为 两 个 局 部 极 小 值 ，s(i+n) 为 一 个 局 
构成 了 一 个 单位 波 ， 到 i+n 为 上 升序 列 ， 


定义 1 


1) 杂 波 合并 条 件 
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P2 


BANT 


TA BERE EL AG 20-70 ms, Ry 
70-200 ms， 所 以 周 
的 幅 
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Ai | 采样 点 ， 假 
部 极 大 


期 为 
Ad AUG 


20 ms 的 波 被 认为 是 


值 小 于 10 AV 同样 被 判定 为 杂 波 。 


a) 不 完整 波形 条 件 


定义 序列 s) 中 的 极 值 点 索引 为 序列 sCa C) ， 那 么 假设 相 


两 个 dX 


的 极 E m 列 为 


[ s(a(i)) , s(a(i - D) , s(a(i +2)) , s(a(i +3)) , s(a(i - 4)) ]; 这 两 个 波 


的 组 合 模式 共 11 种 ， 如 图 


。 今 


需要 合 


1 所 示 ， 其 中 5 种 为 不 完整 的 模式 ， 


h = s(a(i +1)) - s(a(i)) 

h, = s(a(i +1)) — s(a(i + 2)) 
h, = s(a(i - 3)) - s(a(i + 2)) 
h, = s(a(i - 3)) - s(a(i + 4)) 


则 图 1 中 不 完整 的 波形 模式 可 归纳 为 下 述 


h/h, 


5 种 规则 : 
«r&h,lh,«r 


hlh«r&h,l/h«r 
h,lh«r&h,lh,«r 


h; | h, 
& h, | 


<r&hħ l/h 2r 
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录用 定稿 


h/h, <r&h/h >r 
&hħ/lhzr&hl/h <r 
其 中 7 为 合并 系数 ， 之 前 的 研究 中 表明 r=0.5 可 以 较 好 地 适应 
各 种 节律 的 波 。 对 于 尖 形 波 ，r=0.3， 尖 形 波 需要 满足 以 下 三 个 
条 件 : 20ms <T <200ms ; 
其 中 hye 为 该 波 之 前 1 分钟 内 所 有 波 的 平均 幅 值 。 
b) 增 减 序列 合并 算法 (MIDS) 
每 两 个 相 邻 的 基于 极 值 点 定义 出 的 波 做 一 次 运算 ， 根 据 规 
价 是 否 为 不 完整 波 或 杂 波 ， 若 是 ， 则 执行 算法 1 的 合并 操 


hIT»2; 突出 于 背景 h/h, >4， 


则 评 
作 。 
算法 1 增 减 序列 合 


Input: raw time sequence s; 


(MIDS) 


index of extremum sequence a. 
Output: 
for each value s(a(i)) of s DO 


the merged sequence. 


if [s(a(1)), s(a(i)),s(a(i+2))] is a cluster or incomplete then 


a(i - 1) €- argmax(s(a(i *-1)),s(a(i 4-3))) 


a(i*l-k)«—-a(i*3*-k), k =1...N-—3-i 
end if 
i«-—i-2 
end for 
return s(a) 
1.1.2 特征 计算 
使 用 上 节 的 MIDS 算法 处 理 原始 信号 后 ， 得 到 了 周期 分 割 
序列 ， 以 分 割 后 的 单个 完整 波形 [ s(a() sai +), (ai - 2) ] 
为 基础 ， 提 取 17 维 时 域 特征 ， 各 个 特征 计算 过 程 如 下 : 
a) 周 期 , 即 了 = a(i - 2)-a(i) : 
b) 上 升幅 度 刀 = s(a(i 4-1) — s(a) 
c) 下 降幅 度 凡 — sai +1) -slali +2)) 
DEFEK a(i 4-1) - a) : 
e) 下 降 时 长 a(i 1) -a(i 2): 
9 波形 幅 值 的 标准 差 LS (s(k) s,s) ， 评 价 波形 变化 
k-a(i) 
程度 ; 
DRE 2s(ali +1) — s(a() — slali + 2)); 
DEPIM |S so? ; 
k=a(i) 
NM ] «e» 
i 幅 值 均值 > 》 sq : 
kz-a(i) 
] 相 邻 点 差 值 标准 差 


a(i*2)-l . Si 
[E censor wmo 
k-a(i) 
动 程度 ; 
k)Hjorth 参数 5， 复杂 度 ， 化 简 表 示 为 
ali+2)-2 la(i+2) 
| £ TEE 
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T X (s(k)- Eau) 
DIRE RA emo 3， 度 量 波形 的 聚集 程度 ; 
(> SE- Spean) Y 
k=a(i) 
max(s(k)) 
m) 最 大 幅 值 与 波形 标准 差 的 比值 ] «&» "E 
(s(K) EE Sean) 
k=a(i) 
中 上 升 角 度 的 余 切 一 < 0， 
s(a(i +1)) - s(a)) 
0) 下 降 余 切 a(i+1)—a(i+2) 


s(aüi + 1D) —s(ai*2) 
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在 本 实验 中 ， 选 择 时 长 为 1 s 的 多 导 联 脑 电 
本 ， 因 此 每 一 个 导 联 中 的 这 17 个 时 域 特 征 取 所 


BOSE 
完整 波 的 均 


值 ， 因 此 特征 维度 为 17*N,. N 为 导 联 数量 。 
1.2 基于 随机 映射 的 旋转 森林 

1.2.1 随机 映射 

随机 映射 


(random porjection, RP) 是 机 器 学 
维 方法 ， 它 将 高 维 空间 ga 中 的 样本 集 S, 通过 
FE M,a 映射 到 低 维 空间 Rr 中 ， 如 式 (1 
Johnson-Lindenstrauss Lemmat7 给 出 了 这 种 映射 
精度 范围 。 


$5, = M,,48, 


习 中 的 一 种 降 
个 随机 转换 矩 
) 09 所 示 ， 


方法 降 维 后 的 


(1) 


定理 1 Johnson-Lindenstrauss Lemma. i2 


t^ [B] PRO n 个 


间距 离 变 化 不 会 超过 (+e) 。 
对 于 任意 的 0<g<1 与 正 整 数 n， 有 整数 
kz4(e [2-8 /3) "lnn 
则 对 于 任意 的 空间 Re 中 包 
> R*， 且 对 于 任意 u,v e S 存在 : 


DE fR? 


a- eu -vf <f- fo» 


证 明 过 程 见 文献 [17] 。 
忆 此 ， 定 理 1 指出 ， 在 低 维 空间 维度 不 小 于 

提 下 ， 映 射 后 的 样本 间距 离 相 比 原始 空间 中 的 数 
所 内 保持 不 变 ， 并 且 映 射 了 可 以 随机 得 出 。 相 比 
法 , 随机 映射 的 计算 量 非常 小 ， 

随机 映射 的 复杂 度 仅 为 O(dkn)。 
算 原 始 数 据 集 的 信息 ， 仅 通过 
来 实现 降 维 ， 这 一 特性 对 于 样本 
大 优势 。 
近 几 年 来 ， 随 机 映射 凭借 着 它 较 小 的 计算 量 
储 方 法 较 好 的 性 能 已 被 应 用 在 各 种 领域 中 08191。 


S 


保证 样本 间 
间距 离 有 意义 的 


Bs 


对 于 nn 个 样本 点 的 原始 数据 集 ， 
Kx, PERIERE 


样本 点 可 以 映射 到 一 个 为 OUosg n1 e^) 的 低 维 空间 中 ,并 且 样 本 


(2) 


E n NEERA S. 存在 映 


x (1 e)|u - v[* (3) 


—^4 BUE OW 
据 集 在 一 个 范 
其 他 的 降 维 广 


为 随机 产生 ， 
距离 变化 误差 
数据 集 有 着 较 


以 及 相 比 传统 
本 文 使 用 随 
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录用 定稿 


机 映射 来 实现 旋转 森林 算法 中 的 特征 旋转 部 分 ， 在 保证 变换 效 
果 的 前 提 下 ， 提 高 了 整个 算法 的 计算 效率 。 
1.2.2 改进 的 旋转 森林 算法 
旋转 森林 (rotation forest) 是 Rodr'guezP2o 于 2006 年 提出 
的 一 种 基于 随机 森林 (random forest) 思想 的 改进 算法 。 旋 转 
森林 在 抽取 样本 子 集 的 同时 ， 将 特征 分 为 多 个 子 集 ， 每 一 个 基 
分 类 器 都 选取 不 同 的 特征 子 集 进行 特征 维度 线性 变换 ， 以 此 增 
加 基 分 类 器 间 的 多 样 性 。 相 比 传统 的 随机 森林 算法 ， 旋 转 森 林 
于 其 基 分 类 器 更 大 的 差异 ， 相 比 随 机 森林 会 进一步 地 降低 各 
个 子 模型 间 的 相关 性 ， 从 而 得 到 一 个 方差 更 低 的 模型 ， 这 一 算 
法 在 部 分 领域 已 经 得 到 应 用 PC0。 本 文 使 用 随机 映射 代替 文献 [20] 
中 的 主 成 分 分 析 (PCA) 来 优化 旋转 森林 算法 中 的 核心 部 分 ， 
即 特征 线性 变换 的 过 程 ,随机 映射 相 比 PCA 不 需要 计算 数据 的 
协 方 差 窍 阵 ， 并 且 定 理 1 保证 了 随机 投影 的 精度 ， 整 个 计算 流 
程 如 下 : 
DAIRE Xay AP n 为 特征 维度 ，N 为 样本 数量 ，y 
为 标签 列 ， EE 为 第 个 基 分 类 器 。 假 设 特征 分 为 m 个 不 相交 
特征 子 集 ， 则 每 个 子 集 包含 特征 =n/m 个 ; 
b) 随 机 抽取 样本 训练 基 分 类 器 ， 使 用 随机 映射 进行 特征 的 
线性 变换 ， 按 特征 索引 顺序 排列 后 得 到 每 个 基 分 类 器 的 线性 变 
FIERE RR; 
c) 使 用 数据 集 XR Y 训练 基 分 类 器 EE; 
qd) 则 预测 时 样本 各 个 类 别 的 输出 概率 为 


pi TES pred_CjlkR )， 其 中 为 类 别 ， 样 本 最 终 预测 类 别 


73 arg max( pCj|x)) 。 
1.8. 贝 叶 斯 最 小 风险 预测 
1.3.1 海 林 格 距离 
海 林 格 距离 (Hellinger distance? Hellinger 提出 ， 在 统 
计 学 中 ， 用 来 度量 两 个 概率 分 布 的 相似 程度 ， 是 f-divergence 
散 度 的 一 种 ， 定 义 如 下 : 
定义 2 海 林 格 距离 (HD). 
个 分 布 之 间 的 海 林 格 距 离 为 


P. 9-7 MP - 0| G) 


2 


有 概率 分 布 P 和 Q， 则 这 两 


Cieslak 等 人 基于 海 林 格 距离 提出 了 海 林 格 决策 树 (HDDT) 
算法 23， 通 过 在 决策 树 分 裂 时 计算 节点 上 样本 类 间 的 海 林 格 距 
离 代 蔡 传 统 的 gini 指数 ， 在 不 同样 本 比例 的 数据 集 上 取得 了 良 
好 的 效果 。 由 此 可 知 ， 相 比 直接 使 用 样本 比例 度量 类 间 分 布 情 
况 的 方法 ， 海 林 格 距离 度量 表现 出 了 更 好 的 性 能 。 

1.3.2 贝 叶 斯 风险 计算 

本 实验 中 所 使 用 的 为 不 平衡 癫 病 脑 电 数据 集 ， 随 着 类 间 比 
例 的 变化 ， 两 类 样本 各 自 的 误 分 类 代价 应 当 随 之 而 变化 。 本 文 
使 用 代价 敏感 思想 03 来 研究 这 一 问题 ， 提 出 了 一 种 基于 海 林 格 
距离 的 新 颖 的 类 间 不 平衡 评价 方式 ， 并 根据 评价 值 给 出 代价 敏 
感 损失 和 矩阵， 进而 计算 出 各 类 别 贝 叶 斯 最 小 风险 实现 预测 。 


最 小 


„Ghina VEL CERBTI 


I4tE, 等 : 自动 检测 算法 


定义 3 HD 评价 指标 。 有 样本 集 9$， 包 含 两 类 标签 ， 则 类 


间 的 海 林 格 距离 为 


1 
xD -而 — 


其 中 : $1 表示 正 样本 数量 ,5. 表 示 负 样本 数量 ,5 表示 样本 
集 总 的 样本 数量 。 

定义 4 代价 和 矩阵 。 对 于 样本 集 9$， 二 分 类 问题 的 误 分 类 代 
价 和 矩阵 为 


(4) 


C 


d 


c -| : P (5) 


其 中 :，C(-,+)， 表 示 将 负 类 预测 为 正 类 的 代价 ， 
此 处 的 C 值 根据 类 间 的 海 林 格 距离 算出 。 

定义 5 贝 叶 斯 最 小 风险 预测 。 令 p(j|x) 为 模型 将 样本 x 
预测 为 /类 概率 值 ， 则 最 终 预测 类 别 为 


反之 亦 然 ， 


y z argmin(? , pGj[)CC. 2) (6) 


本 文 提出 的 基于 贝 叶 斯 最 小 风险 预测 的 算法 考虑 了 训练 模 
型 的 数据 集 的 样本 分 布 情况 ， 根 据 类 间 的 不 平衡 程度 给 出 代价 
损失 和 矩阵， 将 使 用 不 平衡 数据 集训 练 出 的 偏向 多 数 类 的 模型 通 
过 赋予 不 同 的 误 分 类 损失 加 以 调节 。 这 一 算法 将 模型 看 做 一 个 
黑箱 子 ， 不 在 模型 内 部 针对 不 平衡 训练 集 问题 进行 调整 ， 而 是 
在 模型 之 外 根据 训练 集 的 实际 分 布 给 出 预测 概率 的 置 
过 计算 最 小 贝 叶 斯 风险 来 预测 样本 类 别 ， 
集 带 来 的 影响 。 
算法 2: 基于 海 林 格 距离 的 贝 叶 斯 最 小 风险 预测 CHD-MBRO 


Input: Train set S; 


zm 


2H 


TE, X 


从 而 减少 不 平衡 训练 


Probabilities of each class for sample x p(J|x). 
Output: predicted class y. 


calculate Hellinger Distance: 


HD < zlis- 


calculate cost matrix: 
0 1-J2HD 
C — 
1 0 


The predicted class: 


?=argmin(2,PCDOCG j)) 


return y 
14 算法 流程 

算法 流程 如 图 2 所 示 。 
结果 与 讨论 
2.1 数据 集 

本 文 使 用 公开 的 疗 痫 脑 电 数据 集 CHB-MITP3-24 来 测试 所 
提出 算法 的 性 能 。 为 了 确保 数据 集 特征 维度 的 统一 ， 选 用 数据 
集中 使 用 23 导 联 采集 脑 电 信号 的 12 个 病人 的 数据 , 23 个 导 联 


2 实验 


in 
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包括 FPI-F7, F7-T7, T7-P7, P7-O1, FPl-F3, F3-C3, C3-P3, 
P3-O1, FP2-F4, F4-C4, C4-P4, P4-O2, FP2-F8, F8-T8, T8-P8, 
P8-O2, FZ-CZ, CZ-PZ, P7-T7, T7-FT9, FT9-FTIO, FTIO-T8, 
T8-P8. 信号 采样 率 为 256Hz, 每 一 份 病人 的 数据 中 均 包含 多 次 


ROW TE -o 


多 导 联 EEG 信 
号 输入 


M 
mE RIE, EX) 


图 2 


22 实验 设计 


算法 整体 流程 


实验 环境 为 Ubuntul 6.04 系统 、 英 特 尔 这 -7700k 处 理 器 、 
据 中 样本 为 时 长 1 s 的 多 导 联 脑 电 片 


32 GB 运行 内 存 。 实 验 数 


Bt. BURA FOROR A E HG 


病 发 作 之 前 的 脑 电信 和 号 


随机 选 出 时 长 


于 发 作 时 长 不 固定 , AH 


有 片段 构造 正 档 


EAR, 


每 次 发 作 的 正 负 档 


Ht fg — ORE 


固定 的 间 期 脑 


BT EE. 


本 比例 是 不 同 的 。 


Is] 
ES 
m 
E 
ge 
4 
m 
4 
E 
3 
A, 
[3 
ES 
E: 
x 
* 
十 
D 
R 
F 
& 
3e— 
ye 


sensitivity = TP / (TP + FN) 
specificity = TN / (TN + FP) 
precision =TP / (TP + FP) 


precision * sensitivity 


FB-ü3 


B^ 


(B * precision) + sensitivity 


latency — seizure onset — predicted seizure onset 


Ti — DOR EUR] AKIE T6 B 


其 中 : 检测 延迟 为 基于 事件 
数 是 精准 率 与 灵敏 性 的 一 个 


0 权 平 ] 


ig 


A zs 
ds» 


E 价 方式 的 评价 指标 。 FB 分 
T EROR ES UTR, de 


M BERGER, KKE HE 


TÉ 8 =2 CR INOMEEZS RUE SEE, 即使 用 F2 分 数 作为 评价 指 
标 。 
23 RAW 
实验 对 12 418 e EI TREE, ETT 1s i 
病 样 本 的 分 类 结果 如 表 1 所 示 。 
dl 基于 1s 片段 的 疗 病 脑 电 分 类 结果 
编号 灵敏 性 /% 特异 性 /% F2 分 数 
1 94.59 97.36 0.9501 
2 82.98 59.13 0.7655 
3 92.52 97.55 0.9623 
4 88.60 94.66 0.8959 
5 92.75 98.21 0.9377 
6 96.72 90.04 0.9117 
7 90.80 96.00 0.9171 
8 93.12 94.58 0.9331 
97.03 93.27 0.9601 
10 87.43 98.24 0.8912 
11 97.02 97.11 0.9700 
12 74.33 94.05 0.7718 
总 体 90.66 92.52 0.9055 


按 此 方法 处 理 每 一 次 改作， 得 到 一 个 不 平衡 的 数据 集 ， 不 同 份 
数据 的 不 平衡 比例 约 在 1: 4 到 1: 20 之 间 。 为 了 更 好 地 评估 所 
提出 算法 的 性 能 ， 使 用 留 一 法 (leave-one-out) 进行 交叉 测试 。 


即 假定 患者 n 的 脑 电 数据 


中 存在 入 次 发 作 ， 则 测试 第 i 次 发 作 


时 使 用 剩 下 的 N-7 次 数据 训练 ， 迭 代 守 的 值 直至 i=N。 
算法 性 能 评价 分 为 两 部 分 ， 分 别 为 


a) 基 于 片段 评价 (seg 


单位 ， 评 估 模 型 性 能 ， 是 一 个 壮 痛 脑 
b) 基 于 事件 评价 〈eventrbased ) 。 


ment-based )。 


EH 


即 以 1s 时 长 的 样本 为 
本 的 分 类 问题 。 
以 一 次 发 作为 单位 ， 


判断 


是 否 检 出 以 及 检 出 延迟 ， 是 一 个 疾病 发 作 的 检测 问题 。 


性 能 ， 所 选取 的 评价 指标 为 灵敏 性 (sensitivity )， 特 异 


于 样本 集 正 负 比例 不 平衡 ， 因 此 无 法 用 准确 率 评价 模型 


[z^ 


性 


Cspecificity), FB 412 Fp -score) 以 及 检测 延迟 (latency)， 


Hbi Xu: 


从 表 1 中 可 以 看 


敏 性 和 特异 性 90.66 
为 了 体现 所 提 
随机 森林 以 同样 的 方式 做 测试 ， 所 提 


使 有 


H REENA Z 
效果 ， 大 部 分 灵敏 性 在 83% 以 上 ， 特 异 必 


林 上 进行 了 特征 子 空间 分 割 、 特 征 旋转 、 代 


昌 上 均 表 现 出 了 良好 的 
EÆ 90% 以 上 。 平均 灵 
W、92.52%， 平 均 F2 分 数 为 0.9055。 

8 算法 相 比 传统 机 器 学 习 算 法 的 优越 性 能 ， 
算法 正 是 在 随机 森 
价 敏感 以 及 贝 叶 斯 


最 小 风险 预测 这 些 改进 得 到 的 。 在 评价 指标 中 ，F2 分 数 综合 


hes J 


模型 的 灵敏 性 和 精准 率 ， 


数 来 进行 算法 之 间 的 性 能 比较 。 同 时 ， 表 2 列 出 了 随机 森林 在 


12 份 数据 上 和 
林 ， 提 高 了 1 


的 平均 指标 值 ， 结 果 表 明 ， 提 上 
E, 0.0867 的 F2 分 数 ，1 


0.29% 的 灵敏 和 


图 3 通过 不 同 病 人 数据 的 F2 分 


的 算法 相 比 随机 森 


特异 性 只 


FRET 2.8%。 在 临床 上 ,， 漏 判 的 瘦 痢 放电 相 比 误 
要 付出 更 大 的 代价 ， 提 出 的 算法 则 符合 这 个 思想 ， 
统 模型 提升 明显 。 


站 的 正常 脑 电 


且 相 比 传 
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o 


加 本 文 算法 F2 分 数 ”号 随机 森林 F2 


2 3 4 5 6 7 8 9 10 11 12 


分 数 


图 3 模型 F2 分 数 比 较 


DRE, 


12 中 存在 漏 检 。 考 虑 每 一 
均 检 测 延 迟 为 1.32s。 
段 提 出 的 大 部 分 算法 的 评价 方式 为 基于 疾 冯 事 件 
出 了 在 公开 数据 集 CHB-MIT | EI] Efl Az 


98.6596, ^F 
由 于 现 阶 
的 评价 ， 表 5 页 


T 


ChinaX 


等 : 基于 贝 叶 斯 最 小 风险 的 


作 事 件 检测 研究 的 结 
明 ， 所 提 


出 的 算法 效果 相 比 丰 
其 他 的 研究 不 同 , 本 文 的 实验 结果 是 


iv 合 作 期 二 


Auk 自动 检 ; a | 法 


份 数据 的 发 作 次 数 ， 平 均 检 出 率 为 


果 ， 并 与 本 文 所 提 


出 方法 的 比较 。 


结果 表 


他 文献 有 所 提高 ， 并 且 与 大 部 分 


在 不 平衡 数据 集 上 


得 到 的 ， 


这 说 明 该 算法 在 不 平衡 数据 集 上 有 着 极 大 的 潜力 。 


表 2 与 传统 模型 的 结果 对 比 表 5 与 其 他 方法 比较 结果 
模型 灵敏 性 /% 特异 性 /% F2 分 数 方法 检 出 率 /% 延迟 /s 
随机 森林 80.37 95.32 0.8188 文献 [2] 方 法 96 4.6 
本 文 算法 90.66 92.52 0.9055 文献 [25] 方 法 100.0 3.36 
进一步 地 ， 为 了 验证 所 提出 算法 中 的 核心 部 分 贝 叶 斯 最 小 文献 [26] 方 法 98.5 1.76 
风险 预测 相 比 传统 不 平衡 分 类 算法 的 优越 性 能 ， 在 同样 的 模型 本 文 算法 98.65 1.32 
To 分 别 采用 权重 法 与 SMOTE 过 采样 这 两 种 方法 处 理 训练 集 ， 2.4 讨论 
来 代替 本 文 的 贝 叶 斯 最 小 风险 预测 方法 。 在 SMOTE 处 理 过 程 大 部 分 脑 电信 号 的 模式 识别 研究 均 是 在 平衡 数据 集 上 测试 
rp, 调节 采样 率 生 成 与 多 数 类 等 量 的 少数 类 样本 , 在 权重 法 中 ， ”所 提出 的 算法 性 能 ， 本 实验 考虑 患者 脑 电 信号 中 的 癫 病 波 数量 
则 按照 样本 比例 加 权 。 从 表 3 的 对 比 结果 中 可 以 看 出 ， 本 文 算 ”很 少 ， 针 对 这 一 不 平衡 的 数据 集 分 类 问题 提出 了 基于 贝 叶 斯 反 
法 相 比 SMOTE 方法 与 权重 法 在 灵敏 度 上 分 别提 高 了 3.85%、 险 预 测 的 算法 , 并 在 不 平衡 的 疗 病 脑 电 数 据 集 上 进行 应 用 分 析 ， 
4.98%，F2 分 数 提高 了 0.0285、0.0384。 这 一 结果 表明 ， 本 文 结果 可 以 看 出 ， 在 不 同类 别 比 例 的 测试 集 上 该 算法 均 可 以 保 
是 出 的 算法 在 不 平衡 数据 集 上 的 效果 要 优 于 传统 的 权重 法 与 ” 持 良 好 的 性 能 以 及 稳定 的 效果 。 只 要 知道 训练 该 模型 的 训练 集 
SMOTE 算法 。 样本 分 布 情况 ,就 可 以 通过 不 同 的 误 分 类 代价 计算 贝 叶 斯 风险 ， 
表 3 与 传统 不 平衡 数据 集 处 理 算法 的 结果 对 比 以 此 代替 传统 的 输出 概率 实现 样本 的 分 类 。 
算法 灵敏 性 /% 特异 性 /% F2 分 数 本 文 使 用 了 高 效 简洁 的 时 域 特征 ， 在 医生 判读 脑 电 图 的 过 
权重 法 85.68 93.94 0.8671 程 中 ， 信 号 的 时 域 特征 是 最 直接 的 特征 ， 且 物理 意义 明确 ， 医 
SMOTE 86.81 93.63 0.8770 生 往 往 可 以 通过 疗 冯 波 中 的 尖 、 环 波及 其 复合 波 的 形状 特征 做 
本 文 算法 90.66 92.52 0.9055 出 判断 。 本 文 使 用 了 我 们 之 前 研究 提出 的 周期 分 割 算法 来 进行 
为 了 进一步 评估 模型 的 发 作 检测 性 能 ， 将 每 次 测试 的 发 作 “时 域 特 征 的 提取 ， 这 一 算法 基于 合并 、 分 割 的 规则 模拟 医生 在 
脑 电 按时 间 顺 序 排 列 ， 以 此 来 观察 每 次 发 作 是 否 被 检 出 ， 以 及 “判读 时 域 信号 的 过 程 中 视觉 完 形 ， 神 经 感受 野 的 概念 ， 在 时 序 
其 检 出 延迟 ， 表 4 列 出 了 基于 事件 的 疝 病 检测 结果 。 列 信号 处 理 中 相当 于 为 特征 提取 的 过 程 给 出 了 一 个 灵活 、 自 适 
表 4 WAREM R 应 时 间 窗 口 ， 该 窗口 符合 人 的 视觉 感知 与 判断 ， 所 分 割 出 的 完 
编号 检 出 率 /% 延迟 As 整 波形 符合 人 的 视觉 感知 ， 因 此 提取 出 的 特征 也 提供 了 时 序 信 
1 100 1.14 号 中 每 一 个 完整 波形 的 信息 ， 实 验 结果 证 明了 所 提取 的 特征 的 
2 100 0.5 有 效 性 。 另 外 ， 本 文选 用 了 1 s 时 长 的 片段 作为 样本 进行 分 类 ， 
3 100 0.86 相 比 大 部 分 癖 病 脑 电 识别 算法 ， 这 是 一 个 非常 短 的 时 间 窗 口 ， 
4 100 2.25 大 部 分 算法 不 足以 在 1 s 内 提取 出 判别 疗 病 放电 的 信息 ， 而 对 
5 100 2.2 于 基于 周期 分 割 的 特征 提取 方法 来 说 ， 这 些 信 息 是 足够 的 。 进 
6 100 0.5 一 步 来 看 ， 这 一 特征 提取 方法 是 基于 每 一 个 波 来 提取 特征 的 ， 
7 100 0.67 从 而 有 效 地 判断 出 一 个 完整 的 波形 是 否 是 异常 放电 ， 这 种 在 短 
8 100 1.6 时 间 内 提取 有 效 特征 的 方法 在 在 线 检测 中 有 着 极 大 的 优势 。 
9 100 1.25 在 模型 部 分 ， 本 文 使 用 随机 映射 优化 了 传统 旋转 森林 方法 
10 100 1.57 中 特征 子 空 间 的 变换 这 一 核心 部 分 。 相 比 传统 的 PCA 旋转 方 
11 100 0.57 法 ， 随 机 映射 是 一 种 快速 的 投影 算法 。PCA 需要 计算 特征 的 协 
12 92.31 2.77 E 阵 ， 并 通过 SVD 分 解 来 求 得 该 矩阵 的 特征 值 与 特征 向 


结果 表明 ，11 份 数据 中 的 发 作 全 部 被 检 出 ， 仅 在 数据 


gm 过 
Br 
TEE 


F 序 后 得 出 变换 和 矩阵， 这 一 计算 计算 代价 高 


昂 。 随 机 映射 
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则 使 / 


随机 生成 的 变换 和 
变性 可 以 保证 变换 后 的 精度 ， 相 当 于 根据 数据 间 的 嚼 
影 。 随 机 映射 无 需 计算 数 
量 ， 计 算 量 要 小 于 PCA。 
贝 叶 斯 最 小 
型 提供 了 良好 的 分 类 性 能 ， 并 
明 ， 对 比 未 作 处 理 的 传统 随机 森林 算法 
升 。 传 统 的 不 平 
所 提出 的 不 平衡 分 类 算法 与 书 


E 阵 进行 映射 ， 


离 进行 投 


定理 1 给 出 的 距离 不 
E 
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风险 的 预测 方法 为 不 平衡 数据 集训 练 出 来 的 模 


衡 分 类 方法 往外 


计算 过 程 简单 。 表 2 的 结果 表 
和 效果 上 有 着 明显 的 提 
FE 为 过 采样 、 欠 采样 等 ， 本 文 将 


已 经 从 效果 上 体 


重 法 、SMOTE 算法 对 比 ， 表 3 
了 岗 了 本 文 算 法 要 优 于 这 两 种 传统 算法 ， 同 时 在 
训练 效率 上 ， 本 文 算法 在 时 间 和 空间 效率 上 均 有 所 提升 。 在 本 


文 的 树 模型 中 ， 权 重 法 对 少数 类 错 分 做 出 的 加 权 惩 罚 体 现在 每 


一 个 叶 节点 分 裂 的 过 程 中 ， 甩 
SMOTE 算法 根据 所 有 的 少数 类 样本 及 
本 ， 需 要 根据 欧式 距离 计算 每 一 个 少数 类 样本 的 近邻 ， 并 根据 
预 设 好 的 采样 率 与 每 一 个 近邻 生成 新 的 样本 。 假 设 数量 为 n 的 


f 需 的 乘法 次 数 要 多 于 本 文 算法 。 


近邻 来 生成 少数 类 样 


训练 集中 , 少数 类 样本 数量 为 p, SMOTE 算法 在 计算 每 个 少数 


类 样本 的 K 近邻 时 
的 空间 。 在 生成 村 


数目 线性 相关 ， 


他 的 额外 计算 ， 


据 集 情况 下 没有 


D 


并 


需要 遍历 p? 次 ， 存 储 近 邻 索引 则 需要 p*k 
本 过 程 中 ， 时 间 复 杂 度 则 与 需要 生成 的 样本 
且 需 要 额外 的 空间 去 存储 这 些 生 成 的 样本 。 


本 文 算法 的 在 知道 各 类 样本 数量 的 情况 下 ， 训 练 过 程 与 平衡 数 
区 别 ， 除 计算 一 次 海 林 格 距离 外 不 需要 进行 其 
双 需 在 预测 时 遍历 一 次 测试 集 即 可 得 出 最 小 风 


险 ， 这 一 过 程 的 时 间 效 率 高 于 SMOTE 算法 。 所 需 额 外 存储 的 


变量 仅 为 代价 敏感 矩阵 ， 


而 在 二 分 类 问题 中 ， 代 价 敏感 矩阵 为 


两 个 值 ， 所 需 存储 空间 可 忽略 不 计 ， 远 低 于 SMOTE 方法 的 空 


间 复杂 度 。 
从 理 


更 新 或 者 欠 采 村 


影响 模型 性 能 ; 


处 到 


论 角度 来 看 ， 本 文 算法 不 需要 对 原始 数据 集 做 生成 、 
.从 采样 方法 会 丢弃 掉 大 量 的 负 样本 信息 ， 


SH 


随机 过 采样 采 / 


有 随机 复制 少数 类 样本 来 增加 少 


数 类 样本 ， 会 造成 样本 多 样 性 不 足 ， 少 数 类 样本 的 信息 实际 上 


没有 增加 


的 过 程 相 当 于 产生 了 
数 类 样本 的 身上 ， 但 这 个 权 


过 采样 的 方法 是 通过 近 人 


， 造 成 模型 泛 化 性 能 变 差 ， 权 重 法 对 少数 类 样本 加 权 
新 的 数据 分 布 ， 将 分 类 器 的 重点 集中 在 少 


值 的 选择 往往 
合成 新 样本 ， 为 生成 的 样本 提供 了 一 


过 于 主观 ; SMOTE 


定 的 多 样 性 ， 但 同样 存在 缺陷 ， 首 先 最 优 近邻 数值 难以 确定 ， 


其 次 由 类 边缘 样本 生成 的 样本 会 造成 边界 模糊 的 问题 ， 加 大 样 


本 集 的 可 分 性 。 本 文 提出 的 不 平衡 分 类 算法 统计 了 数据 的 分 布 


情况 ， 但 不 需要 对 数据 集 做 任何 修改 ， 而 是 根据 分 布 给 出 不 同 


的 误 分 类 代价 ， 


通过 获得 
题 的 解决 。 


个 整体 误 分 类 


在 模型 层面 对 不 同类 别 的 错 分 情况 计算 风险 ， 
风险 最 小 的 模型 来 实现 不 平衡 分 类 问 
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框架 由 基于 视觉 组 织 的 时 域 特征 提取 、 改 进 的 
旋转 森林 以 及 贝 叶 斯 最 小 风险 预测 三 部 分 组 合 而 成 。 所 提取 的 


时 域 特征 为 短 时 间 的 波形 特征 ， 


等 ,这 些 特征 大 部 分 都 是 可 以 视觉 观察 到 的 一 些 波 的 


如 时 长 、 幅 值 、 锐 度 、 峭 度 等 
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从 医生 视觉 判读 的 角度 来 看 ， 这 些 特 征 已 经 为 单个 波 提供 了 一 
定 的 可 分 性 。 模 型 部 分 采用 随机 映射 优化 了 标准 的 旋转 森林 算 
法 ， 并 且 针 对 特征 的 线性 变换 降低 了 各 个 子 分 类 器 的 相关 性 ， 
可 以 进一步 地 降低 整个 模型 的 方差 。 基 于 贝 叶 斯 最 小 风险 的 预 
测 则 是 本 文 算法 中 解决 数据 不 平衡 的 核心 技术 ， 效 果 上 优 于 传 
统 模型 以 及 常见 的 不 平衡 分 类 算法 , 并 且 训练 效率 上 有 所 提升 。 
因此 整个 算法 框架 在 不 平衡 数据 集 的 分 类 问题 上 表现 出 了 优越 


的 性 能 。 


P2 


3 RA 

AEH T dE TRR A FA A BEMA, O4 
多 导 联 脑 电信 号 分 割 周 期 后 的 时 域 特 征 输入 改进 的 旋转 森林 模 
型 ， 并 且 使 用 贝 叶 斯 最 小 风险 代 蔡 输出 概率 得 到 测试 样本 的 类 


别 。 最 终 在 基于 ls BRA ASIE GHI T 90.66% 的 灵 
敏 性 ，92.52% 的 特异 性 ，0.9055 的 F2 分 数 ， 相 比 传统 的 随机 
森林 模型 ， 提 高 了 6% 的 灵敏 性 ，0.9 的 F2 分 数 ， 并 且 在 发 作 
检测 方面 ， 检 出 了 98.56% 的 疗 病 改作， 检测 延迟 为 1.32s。 这 
一 算法 在 不 平衡 脑 电 数据 集 上 得 到 了 优良 的 性 能 ， 优 于 许多 平 
衡 数据 集 上 的 自动 检测 算法 ， 并 且 解 除了 疗 冯 样 本 不 充足 这 一 
限制 。 本 实验 中 选取 固定 时 长 的 间 期 脑 电 片段 构建 不 同类 别 比 
例 的 样本 集 ， 若 加 大 不 平衡 比例 ， 本 文 提出 的 方法 相 比 传统 方 
法 理论 上 提升 会 更 显著 。 同 时 算法 符合 临床 判读 脑 电 图 的 思想 ， 
有 着 极 大 的 临床 意义 。 
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